Loading...
机构名称:
¥ 6.0

预测将无人机系统 (UAS) 集成到国家航空航天 (NAS) 的结果是一个复杂的问题,在允许 UAS 常规访问 NAS 之前,需要通过模拟研究来解决。本论文重点介绍使用博弈论方法提供 2D 和 3D 模拟框架,以评估有人驾驶和无人驾驶飞行器共存场景中的集成概念。文献中的基本差距在于有人驾驶和无人驾驶飞行器之间相互作用的模型不足:a) 它们假设飞行员行为是先验已知的,b) 它们忽略了决策过程。这项工作的贡献是提出一个建模框架,其中使用强化学习和称为 k 级推理的博弈论概念对人类飞行员的反应进行建模,以填补这一空白。K 级推理概念基于人类具有不同决策水平的假设。强化学习是一种植根于人类学习的数学学习方法。在这项工作中,经典和近似强化学习(神经拟合 Q 迭代)方法用于对具有 2D 和 3D 机动的飞行员的时间扩展决策进行建模。使用有人驾驶飞机和配备感知和避免算法的全自动 UAS 的示例场景对 UAS 集成进行分析。

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日PDF文件第1页

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日PDF文件第2页

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日PDF文件第3页

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日PDF文件第4页

arXiv:1904.08477v1 [cs.RO] 2019 年 4 月 17 日PDF文件第5页